期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于Hilbert-R树分级索引的时空查询算法
侯海耀, 钱育蓉, 英昌甜, 张晗, 卢学远, 赵燚
计算机应用    2018, 38 (10): 2869-2874.   DOI: 10.11772/j.issn.1001-9081.2018040749
摘要1023)      PDF (993KB)(334)    收藏
针对树形空间索引中多路查询及未考虑时间维索引的问题,提出一种结合时间和聚类结果的Hilbert-R树索引构建策略。首先,按照数据采集的周期划分时空数据集,并在此基础上建立时间索引,通过Hilbert曲线对空间数据进行分割编码,将空间坐标映射到一维区间;其次,依据数据要素在空间中的分布,采用动态确定 K值的聚类算法,结合聚类结果构建高效的Hilbert-R树空间索引;最后,基于Redis几种常见的键值数据结构,对时空数据的时间属性和聚类结果构建分级索引。在时空范围及目标矢量对象查询的实验中,与缓存敏感R+树(CCR+)相比,所提算法可有效减少时间开销,查询时间平均缩短约25%,对不同密集型数据具有良好的适应性,可更好地支持Redis应用于海量时空数据查询。
参考文献 | 相关文章 | 多维度评价
2. 基于迭代填充的内存计算框架分区映射算法
卞琛, 于炯, 修位蓉, 英昌甜, 钱育蓉
计算机应用    2017, 37 (3): 647-653.   DOI: 10.11772/j.issn.1001-9081.2017.03.647
摘要446)      PDF (1133KB)(382)    收藏
针对内存计算框架Spark在作业Shuffle阶段一次分区产生的数据倾斜问题,提出一种内存计算框架的迭代填充分区映射算法(IFPM)。首先,分析Spark作业的执行机制,建立作业效率模型和分区映射模型,给出作业执行时间和分配倾斜度的定义,证明这些定义与作业执行效率的因果逻辑关系;然后,根据模型和定义求解,设计扩展式数据分区算法(EPA)和迭代式分区映射算法(IMA),在Map端建立一对多分区函数,并通过分区函数将部分数据填入扩展区内,在数据分布局部感知后再执行扩展区迭代式的多轮数据分配,根据Reduce端已分配数据量建立适应性的扩展区映射规则,对原生区的数据倾斜进行逐步修正,以此保障数据分配的均衡性。实验结果表明,在不同源数据分布条件下,算法均提高了作业Shuffle过程分区映射合理性,缩减了宽依赖Stage的同步时间,提高了作业执行效率。
参考文献 | 相关文章 | 多维度评价
3. 基于信任和项目偏好的协调过滤算法
郑洁, 钱育蓉, 杨兴耀, 黄兰, 马婉贞
计算机应用    2016, 36 (10): 2784-2788.   DOI: 10.11772/j.issn.1001-9081.2016.10.2784
摘要360)      PDF (865KB)(419)    收藏
针对传统协同过滤算法不能深度挖掘用户关系,以及无法对新项目进行用户推荐的问题,提出了基于信任和用户偏好的协同过滤(TIPCF)算法。首先,通过分析用户评分判断用户的可信度并量化用户间的信任程度,挖掘用户潜在的信任关系;其次,考虑到用户之间对于不同目标项目偏好程度的差异会对用户相似性产生影响,在传统用户相似性算法上添加用户偏好度改进相似性算法;然后,通过结合用户信任度和改进的相似度,使得最近邻的选取更加准确;最后,根据用户对项目属性的偏好对新项目进行推荐。Movielens数据集实验结果表明,与传统的协同过滤算法相比,TIPCF算法的平均绝对误差减少了6.7%;在推荐新项目时,TIPCF算法的平均绝对误差减少了10.7%。TIPCF算法不仅提高了推荐的准确度,而且增加了新项目的推荐概率。
参考文献 | 相关文章 | 多维度评价
4. 基于栈式自编码的水体提取方法
王知音, 禹龙, 田生伟, 钱育蓉, 丁建丽, 杨柳
计算机应用    2015, 35 (9): 2706-2709.   DOI: 10.11772/j.issn.1001-9081.2015.09.2706
摘要501)      PDF (619KB)(13070)    收藏
为了进一步提高利用遥感图像进行水体提取的准确率和自动化程度,提出一种基于栈式自编码(SAE)深度神经网络的水体提取方法。通过堆叠稀疏自编码器构建深度网络模型,使用逐层贪婪训练法依次训练每层网络,从像素层面无监督学习特征,避免传统神经网络等方法需进行人工特征分析与选取的问题;用学习到的特征结合相应的样本标签有监督训练softmax分类器;利用反向传播(BP)算法微调优化整个模型。采用塔里木河ETM+数据进行实验,基于SAE的水体提取方法准确率达到94.73%,比支持向量机(SVM)和反向传播(BP)神经网络方法分别高出3.28%和4.04%。实验结果表明,所提方法能有效提高水体提取的精度。
参考文献 | 相关文章 | 多维度评价
5. 云计算环境下软硬件节能和负载均衡策略
钱育蓉 于炯 王卫源 孙华 廖彬 杨兴耀
计算机应用    2013, 33 (12): 3326-3330.  
摘要687)      PDF (867KB)(620)    收藏
针对云计算服务环境下软硬件节能和负载均衡优化问题,提出一种自适应的云计算环境下虚拟机(VM)动态迁移软节能策略。该策略采用常用的硬件能耗感知技术——动态电压频率调节(DVFS)来实现分段优化的系统部件静态节能,又通过VM在线迁移技术实现云平台的动态自适应软件节能。在CloudSim云仿真平台下对比实现DVFS静态节能和自适应负载均衡的软节能策略,经PlanetLab云平台监测数据验证,结果表明:软硬结合的自适应能耗感知策略能够高效节能96%; DVFS+MAD_MMT节能策略(采用平均绝对偏差算法判定主机是否超载,基于最短迁移时间(MMT)原则选择VM移出)
相关文章 | 多维度评价
6. 考虑项目属性的协同过滤推荐模型
杨兴耀 于炯 吐尔根·依布拉音 钱育蓉 孙华
计算机应用    2013, 33 (11): 3062-3066.  
摘要1049)      PDF (1027KB)(696)    收藏
针对传统的基于用户的协同过滤(UCF)模型在相似性度量过程中没有充分考虑项目属性的问题,提出了两种考虑项目属性的协同过滤推荐模型。模型首先对用户评分相似性进行优化;然后从项目属性的角度统计用户关于不同项目的评价次数,获得优化的基于项目属性的用户相似性;最后通过自适应平衡因子协调处理两方面的相似性结果进行项目预测与推荐。实验结果表明,在不同的数据集中,新提出的模型不仅时间花费较为合理,而且评分预测准确性明显提高,平均提高了5%,从而证明了模型在改进用户相似性度量精度方面的有效性。
相关文章 | 多维度评价